两个孩子能够继承父亲基因的百分之几?
27 03 2007年在赵若舟的文章《中央电视台的两次低级的科学错误》中有这么一段话:
其一,原解说词我忘了,大致意思是这样的:“一个儿子可以继承父亲50%的基因,两个儿子就可以继承父亲100%的基因。”这个错误高中理科生就可以发现,第二个儿子继承父亲的50%的基因中,又会有50%基因和第一个儿子的相同,因此两 个儿子中,只能继承父亲75%的基因,而不是100%。也就是说父子之间会有50%的基因相同,亲兄弟之间也会有50%的基因相同。
我没有看过那一期节目,但从这个100%基本可以推断中央台犯了一个严重的错误。比方说有这么一个问题:某种彩票买一张中奖的可能性是50%,那么买两张至少有一张中奖的可能性是多少?如果我们问一般的小学低年级学生,他大概会说,是100%。如果我们问学过一点概率的中学生,他会告诉我们是75%。
从75%这个数字看来,赵文中的算法至少要比中央台的算法高明许多。但实际上它也是不合适的。下面我们来做一个较为详细的分析。
我不知道电视节目里讲的是孩子还是儿子。我觉得讨论两个孩子比两个儿子更合适,因为如果是儿子,那么有一条Y染色体已经是确定的,在计算概率是要把它排除,增加了计算的繁琐程度。因此我们在这里主要讨论两个孩子的情况,多少也兼顾一下两个儿子的情况。另外,我们还需要两个假设,一是忽略Y染色体和X染色体基因数的差别;二是忽略线粒体遗传信息的影响。这样我们分析起来才比较简单。从这两个假设也可以看出缺乏基础知识会给思考问题造成一定的困难,所以这里并没有苛责赵文的意思。
首先,每个人的染色体都是一半来自父亲,一半来自母亲,因此每个人都继承了父亲50%的基因。这不是一个概率问题,不是有人多有人少,平均是50%,而是大家都一样。可以看出这一步和买彩票是两回事。
如果一个父亲有两个孩子,那么这两个孩子所继承的父亲的基因有多少是相同的呢?这个答案是不确定的,我们只知道它介于0-100%之间(包括两端)。因为人有23对染色体,精子和卵细胞各有23条染色体,如果不考虑同源染色体之间的交叉互换的话,一个人可以产生2^23种精子或卵细胞(如果考虑到互换,那么这个数字又要扩大很多)。任意两个精子之间有多少基因相同我们当然无法知道。
那么两个孩子能够继承父亲多少基因呢?从上一段我们可以知道这个数字应该在50%-100%之间(含两端)。也就是说当两个孩子对应的精子基因完全相同时,他(她)们一共继承了父亲基因的50%,当他们对应的精子基因完全不同时,他们就继承了父亲100%的基因。当然这两种极端的情形都非常的少(几乎是不可能的)。仍然不考虑互换的话,我们可以把这些不同的情形都写出来:
23/46 (50%), 24/46, 25/46, 26/46, ……45/46, 46/46 (100%)
一共24项,而它们的概率分布恰恰是23次二项式的展开。这样我们知道,两个孩子继承父亲基因的平均比例是75%。也就是说,对于许许多多拥有两个孩子的父亲的平均结果是75%,而对于任何一个具体情况我们都无法知道这个比例是多少。而且,由于46不能被4 整除,我们在上面的排列中并不能找到75%这一数字(也就是说,两个人各从1-46之中任意抽出23个数字,他们两个之间不可能有一半的数字相同,要么有11个相同,要么12个,而不可能有11.5.个相同)。离75%最近的两个比例34/46和35/46出现的概率是C(11,23)/2^23=16%。可见,两个孩子正好遗传父亲75%左右的基因的概率并不大。如果考虑到互换虽然有可能出现75%,但概率又会小得多。
我们顺便再来看一下两个儿子的情况。因为父亲把Y染色体传给儿子,把X染色体传给女儿,所以如果一个父亲没有女儿的话,即使他有一万一亿个儿子他也无法把自己的基因全部传下去,他的X染色体始终无人继承。可见两个儿子和两个孩子的情况还是有所不同的,在概率的计算上也有差别。
以上的分析是针对全部染色体的。对于某一个单个的基因而言,生一个孩子就有50%的可能传下去,生两个就有75%的可能传下去,生三个87.5%,依此类推。这倒和买彩票的原理差不多。但我们必须明确,这里的75%是概率,而不是基因的比例。假使彩票一次中奖的金额是100元,买两张中奖的概率是75%,并不是说你买两张彩票会中75元。
现在我们来总结一下:
1)
某一个基因能被一个孩子继承的概率是50%,能被两个孩子继承的概率是75%。这都是概率问题。
2)
一个孩子能够继承父亲(或母亲)全部基因的50%,这是确定的,不是概率问题。两个孩子能继承多少比例的基因是概率问题,平均比例是75%。
3)
孩子有50%染色体和父亲(或母亲)相同,这是确定的,不是概率问题。同父同母的两个孩子之间基因相同的比例是概率问题,平均比例是50%。
由此我们可以看出,中央台的算法是完全错误的,而赵文中的算法有一定的道理,但也不合适。之所以不合适,是因为混淆了单个基因和全部基因以及必然事件和概率事件之间的差别。
最后还要指出,这里说的“相同”和“不同”是指的基因或染色体的来源,不是基因组的相似程度。不然的话,兄弟两个除了50%的相同之外,另50%其实也是基本相同的,毕竟都是人的基因。